from PIL import Image
import pytesseract

# Ubuntu下通常不需要此行，因为tesseract已经在PATH中
# 如果需要指定tesseract可执行文件的位置，可以取消注释并修改下面的路径
# pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'

def extract_text_from_image(image_path):
    try:
        # 打开图片文件
        img = Image.open(image_path)
        # 使用Tesseract对图片进行文字识别，针对中英文混合的情况
        text = pytesseract.image_to_string(img, lang='chi_sim')  # 同时识别简体中文和英文
        return text
    except Exception as e:
        print(f"Error: {e}")
        return None

def extract_text_from_image1(image_path):
    try:
        # 打开图片文件
        img = Image.open(image_path)

        custom_config = r'--oem 3 --psm 4 -l chi_sim'

        # 使用Tesseract对图片进行文字识别，针对中英文混合的情况
        text = pytesseract.image_to_string(img, config=custom_config)  # 同时识别简体中文和英文
        return text
    except Exception as e:
        print(f"Error: {e}")
        return None

# 示例调用
if __name__ == '__main__':
    image_path = '/home/weiqiangren/Python/project/py-basic-exercises/图片文字识别/企业微信截图_17387351183679.png'  # 替换为你的图片路径
    extracted_text = extract_text_from_image1(image_path)
    if extracted_text:
        print(extracted_text)
    else:
        print("No text extracted.")